ElasticSearch를 보고있던중 이걸로 뭘 해야 할지 고민하던중 평소 극심한 출퇴근길 혼잡에 시달렸는데 나의 출퇴근길에 대한 통계를 내보면 재밌을것 같다는 생각이 들었다.
보통 위 그림처럼 네이버,다음,티맵 등에서 제공하는 교통정보는 개인에게 특화된 정보가 아니라 어는정도 정확 하긴하지만 좀더 개인에게 특화된 교통정보를 제공 해주면 좋을것 같다는 생각이들어 오직 ‘나’를 위한 교통정보 서비스를 분석해보자 한다.
그래서 생각했던 분석 결과는
- 출근 소요시간
- 퇴근 소요시간
- 일자별 통근 시간의 변화
- 날씨와 통근시간 상관관계
위 4개정도 정보만 파악 하는것을 목표로 하였다.
분석을 위해 가장 중요한 것이 source data 수집인데 평소 대중교통을 이용해 출퇴근을 하기에 교통카드 기록이 남아 있을거라 생각하고 사용중인 신용카드의 교통카드 사용 이력을 출력해보았다.
위와 같이 단말기에 카드를 찍은 _시간_ 과 승차역 하차역 정보가 정확이 나온다. 이정도 정보만 있어도 출퇴근 시간을 계산하는데는 문제가 없어 보인다.
대략 위와 같은 모양의 그래프를 그려 출,퇴근에 걸리는 시간과 구간별 소요시간 최대,최소 값등을 분석해본다.
다음 글에서는 ELK(Elastic Search, Logstash, Kibana)의 간략한 소개와 설치방법 및 셋팅 방법을 알아본다.